对用户偏好的演变进行建模对于推荐系统至关重要。最近,已经研究并实现了基于图形的动态方法以供推荐使用,其中大多数侧重于用户稳定的长期偏好。但是,在实际情况下,用户的短期偏好会随着时间的流逝而动态发展。尽管存在试图捕获它的顺序方法,但是如何使用基于动态图的方法对短期偏好的演变进行建模尚未得到很好的认可。特别是:1)现有方法不会像顺序方法一样明确编码和捕获短期偏好的演变; 2)简单地使用最后几个交互不足以建模变化的趋势。在本文中,我们提出了连续时间顺序推荐(LSTSR)的长期短期偏好模型(LSTSR),以捕获动态图下短期偏好的演变。具体而言,我们明确编码短期优先偏好并通过内存机制进行优化,该内存机制具有三个关键操作:消息,汇总和更新。我们的内存机制不仅可以存储单跳信息,而且还可以通过在线新的交互触发。在五个公共数据集上进行的广泛实验表明,LSTSR始终优于各种线路上许多最先进的建议方法。
translated by 谷歌翻译
病变检测是乳房X线照相术的计算机辅助诊断方案中的一个基本问题。如果培训数据在图像风格和质量方面,深度学习技术的进步对这项任务产生了显着的进展。特别地,图像样式的多样性可能主要归因于供应商因子。然而,尽可能多的供应商收集来自供应商的非常昂贵,并且有时对于实验室规模研究是不切实际的。因此,为了进一步将深度学习模型的泛化能力扩展到具有有限资源有限的各种供应商,开发了一种新的对比学习方案。具体地,骨干网络首先具有多种式和多视图无监督的自学习方案,用于将不变功能嵌入到各种供应商样式中。之后,用特定的监督学习重新校准骨干网络与病变检测的下游任务。所提出的方法是用来自四个供应商的乳房X线照片和一个看不见的公共数据集进行评估。实验结果表明,我们的方法可以有效地改善观察和看不见的域的检测性能,并且优于许多最先进的(SOTA)泛化方法。
translated by 谷歌翻译
Deep reinforcement learning has considerable potential to improve irrigation scheduling in many cropping systems by applying adaptive amounts of water based on various measurements over time. The goal is to discover an intelligent decision rule that processes information available to growers and prescribes sensible irrigation amounts for the time steps considered. Due to the technical novelty, however, the research on the technique remains sparse and impractical. To accelerate the progress, the paper proposes a general framework and actionable procedure that allow researchers to formulate their own optimisation problems and implement solution algorithms based on deep reinforcement learning. The effectiveness of the framework was demonstrated using a case study of irrigated wheat grown in a productive region of Australia where profits were maximised. Specifically, the decision rule takes nine state variable inputs: crop phenological stage, leaf area index, extractable soil water for each of the five top layers, cumulative rainfall and cumulative irrigation. It returns a probabilistic prescription over five candidate irrigation amounts (0, 10, 20, 30 and 40 mm) every day. The production system was simulated at Goondiwindi using the APSIM-Wheat crop model. After training in the learning environment using 1981--2010 weather data, the learned decision rule was tested individually for each year of 2011--2020. The results were compared against the benchmark profits obtained using irrigation schedules optimised individually for each of the considered years. The discovered decision rule prescribed daily irrigation amounts that achieved more than 96% of the benchmark profits. The framework is general and applicable to a wide range of cropping systems with realistic optimisation problems.
translated by 谷歌翻译
Discriminativeness is a desirable feature of image captions: captions should describe the characteristic details of input images. However, recent high-performing captioning models, which are trained with reinforcement learning (RL), tend to generate overly generic captions despite their high performance in various other criteria. First, we investigate the cause of the unexpectedly low discriminativeness and show that RL has a deeply rooted side effect of limiting the output words to high-frequency words. The limited vocabulary is a severe bottleneck for discriminativeness as it is difficult for a model to describe the details beyond its vocabulary. Then, based on this identification of the bottleneck, we drastically recast discriminative image captioning as a much simpler task of encouraging low-frequency word generation. Hinted by long-tail classification and debiasing methods, we propose methods that easily switch off-the-shelf RL models to discriminativeness-aware models with only a single-epoch fine-tuning on the part of the parameters. Extensive experiments demonstrate that our methods significantly enhance the discriminativeness of off-the-shelf RL models and even outperform previous discriminativeness-aware methods with much smaller computational costs. Detailed analysis and human evaluation also verify that our methods boost the discriminativeness without sacrificing the overall quality of captions.
translated by 谷歌翻译
针对变压器的神经体系结构搜索(NAS)已用于创建针对某些延迟约束的最新模型。在这项工作中,我们提出了更大,更快的速度,这是一种新颖的量化参数共享NAS,它为8位整数(INT8)量化变压器的架构。我们的结果表明,我们的方法能够产生胜过当前最新技术的BERT模型,即Autotinybert,我们测试了所有潜伏期目标,达到了2.68%的准确性增益。此外,尽管我们技术发现的模型的参数数量比float32的参数数量更大,但由于其参数为INT8,但它们的内存足迹大大较小。
translated by 谷歌翻译
临床文本的自动汇总可以减轻医疗专业人员的负担。 “放电摘要”是摘要的一种有希望的应用,因为它们可以从每日住院记录中产生。我们的初步实验表明,放电摘要中有20-31%的描述与住院记录的内容重叠。但是,目前尚不清楚如何从非结构化来源生成摘要。为了分解医师的摘要过程,本研究旨在确定摘要中的最佳粒度。我们首先定义了具有不同粒度的三种摘要单元,以比较放电摘要生成的性能:整个句子,临床段和条款。我们在这项研究中定义了临床细分,旨在表达最小的医学意义概念。为了获得临床细分,有必要在管道的第一阶段自动拆分文本。因此,我们比较了基于规则的方法和一种机器学习方法,而后者在分裂任务中以0.846的F1得分优于构造者。接下来,我们在日本的多机构国家健康记录上,使用三种类型的单元(基于Rouge-1指标)测量了提取性摘要的准确性。使用整个句子,临床段和条款分别为31.91、36.15和25.18的提取性摘要的测量精度分别为31.91、36.15和25.18。我们发现,临床细分的准确性比句子和条款更高。该结果表明,住院记录的汇总需要比面向句子的处理更精细的粒度。尽管我们仅使用日本健康记录,但可以解释如下:医生从患者记录中提取“具有医学意义的概念”并重新组合它们...
translated by 谷歌翻译
我们提出了一种使用预训练的语言模型的新的无监督方法,用于词汇替换。与以前使用语言模型的生成能力预测替代品的方法相比,我们的方法基于上下文化和脱皮的单词嵌入的相似性检索替代品,即单词在多个上下文中的平均上下文表示。我们以英语和意大利语进行实验,并表明我们的方法基本上要优于强大的基准,并在没有任何明确的监督或微调的情况下建立了新的最新技术。我们进一步表明,我们的方法在预测低频替代品方面的表现特别出色,还产生了多种替代候选者列表,从而减少了根据文章 - 名称协议引起的形态寄电或形态句法偏见。
translated by 谷歌翻译
尽管当黑框功能昂贵时,样品效率是使用贝叶斯优化的主要动机,但基于II型最大可能性(ML-II)的标准方法可能会失败,并且在小样本试验中导致令人失望的性能。本文提供了三个令人信服的理由,以采用完全贝叶斯优化(FBO)作为替代方案。首先,ML-II的失败比使用人为设置的现有研究所隐含的更普遍。其次,FBO比ML-II更健壮,而且健壮性的价格几乎是微不足道的。第三,FBO变得易于实施,并且足够快,可以实用。本文使用相关实验支持该论点,这些实验反映了有关模型,算法和软件平台的当前实践。由于收益似乎超过了成本,因此研究人员应考虑为其应用采用FBO,以防止可能浪费宝贵的研究资源的潜在失败。
translated by 谷歌翻译
近年来,通过分布式数据的隐私保存的因果推断技术的开发引起了人们的关注。为了解决这个问题,我们提出了基于数据协作(DC-QE)的准实验,该实验可以从具有隐私保护的分布式数据中获得因果推断。我们的方法通过仅共享降低维度的中间表示来保留私人数据的隐私,这些中间表示由各方单独构建。此外,我们的方法可以减少随机错误和偏见,而现有方法只能减少治疗效果估计中的随机错误。通过对人工和现实世界数据的数值实验,我们确认我们的方法可以比单个分析得出更好的估计结果。随着我们方法的传播,可以将中间表示形式作为开放数据发布,以帮助研究人员找到因果关系并积累为知识库。
translated by 谷歌翻译
从观察到的时间序列数据中学习稳定的动态是机器人技术,物理建模和系统生物学中的重要问题。这些动态中的许多被表示为与外部环境通信的输入输出系统。在这项研究中,我们专注于投入输出稳定系统,表现出对意外刺激和噪声的鲁棒性。我们提出了一种学习保证输入输出稳定性的非线性系统的方法。我们提出的方法利用了满足汉密尔顿 - 雅各比不平等的空间上的可区分投影来实现输入输出稳定性。找到该投影的问题可以作为二次约束二次编程问题,并分析得出特定的解决方案。此外,我们将方法应用于玩具双基生模型以及训练由葡萄糖胰岛素模拟器产生的基准测试的任务。结果表明,通过我们的方法,具有神经网络的非线性系统可以达到输入输出稳定性,这与天真的神经网络不同。我们的代码可在https://github.com/clinfo/deepiostability上找到。
translated by 谷歌翻译